Bronze data(青铜层数据):在数据工程/数据湖“青铜-白银-黄金(Medallion)”分层中,指最原始、最接近来源系统的数据层,通常只是做了最少的结构化与落盘(例如按批次/流式写入),清洗、去重、校验较少,数据质量与可用性相对较低,主要用于可追溯、回放与后续加工。
/brɒnz ˈdeɪtə/
/brɑːnz ˈdeɪtə/
We store raw logs as bronze data first.
我们会先把原始日志以青铜层数据的形式存起来。
After landing the API payloads as bronze data, the pipeline validates schemas, deduplicates records, and then promotes them to the silver layer for analytics.
在把 API 载荷落到青铜层数据之后,管道会做模式校验、去重,并将数据提升到白银层以支持分析。
“Bronze(青铜)”来自意大利语 bronzo,常用作等级隐喻(青铜/白银/黄金)。在数据架构里借用这种“奖牌分层”来表示数据成熟度从低到高。
“Data(数据)”源自拉丁语 datum(“给出的东西”),data 是其复数形式,现代英语中常作为集合名词使用。